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ii 要 


前 律 边界 加 工 与 言语 理解 紧密 相关 ， 最近 十 几 年 来 逐渐 成 为 心理 学 和 语言 学 的 研究 焦点 。 韵 律 系统 


包含 若干 由 小 到 大 的 韵律 单位 , 不 同 单位 的 韵律 成 分 其 边界 强度 不 同 , 表现 在 音 高 、 延 宕 和 停顿 三 个 声学 线索 
上 的 参数 也 不 同 。 和 句子 的 听力 理解 过 程 中 ,听话 人 运用 声学 线索 感知 权重 策略 对 韵律 边界 的 声学 线索 进行 加 
工 。 从 神经 层面 上 来 看 ， 对 于 韵律 边界 的 加 工 , 大 脑 显示 出 独立 且 特 异性 的 神经 机 制 。 揭 律 边 界 的 加 工 能 力 在 
婴儿 出 生 后 随 年 龄 的 增长 而 发 展 到 了 老年 阶段 则 逐渐 退化 ,而 且 似 乎 能 够 对 二 语 迁 移 。 未 米 , 需要 扩大 对 前 
律 边界 声学 表现 的 考查 范围 ， 进一步 明确 韵律 边界 的 加 工 过 程 ， 进一步 厘清 韵律 边界 加 工 和 向 法 加 工 之 间 的 


关系 ,进一步 关注 二 语 者 韵律 边界 加 工 能 力 的 发 展 。 


关键 词 ”韵律 边界 ， 言 语 理解 ， 声 学 表现 ， 神 经 振荡 
分 类 号 ”B842 
1 引言 


韵律 是 口语 理解 的 核心 (Frazier et al., 2006; 
Holzgrefe et al., 2013)。 韵 律 边 界 ， 作 为 口语 韵律 


2 韵律 边界 的 层级 结构 


严格 分 层 假 说 (Strict layering hypothesis) 认 为 
韵律 系统 包含 6 个 层次 , 音节 (syllable)、 音 步 (foot)、 


竺 征 的 重要 组 成 部 分 ,是 把 语 流 切 分 成 不 同 层次 
的 言语 组 块 的 组 织 框架 (Frazier et.al., 2006)， 其 位 
置 的 设 定 和 声学 特征 的 表现 都 会 影响 听 者 对 句子 
的 理解 。 比如， 它 能 够 促进 句子 的 理解 ,能够 解决 
句法 歧义 ， 能 够 帮助 听 者 分 解 连续 的 言语 信号、 

提取 意义 单位 ， 从 而 习 得 语言 (Holzgrefe-Lang et 
al., 2016; Wagner & Watson, 2010)。 韵 律 边 界 的 加 
工 能 力 与 阅读 理解 的 流畅 性 也 紧密 相关 (Holliman 
et al., 2017). 显然 , 要 了 解 韵律 和 语言 加 工 ， 韵律 
边界 是 不 能 错过 的 和 窗口。 研究 者 围绕 韵律 边界 开 
展 了 众多 的 研究 ， 特别 是 最 近 十 几 年 ， 新 技术 的 
发 展 带 来 了 更 多 的 新 发 现 。 
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韵律 词 (clitic)、 音 系 短语 (phonological phrase)、 语 
调 短 语 (intonational phrase) 和 话语 (utterance) 
(Selkirk,，2005)。 在 音 系 结构 中 ， 每 一 个 韵律 成 分 
由 比 它 低 一 级 的 韵律 成 分 构成 ， 每 个 韵律 成 分 都 
有 它 的 边界 。 同 一 层次 的 成 分 通过 这 个 边界 区 分 
开 来 。 这 样 ， 韵律 边界 和 其 它 的 韵律 特征 (比如 重 
音 ) 就 构成 了 言语 交际 中 词语 切 分 和 句法 解析 的 
框架 。 

韵律 边界 的 层级 在 口头 交际 中 能 够 被 说 话 人 
和 听话 人 区 分 ， 区 分 的 依据 是 边界 层级 所 对 应 的 
边界 强度 ,而 强度 由 边界 声学 线索 的 参数 表征 
(Cole, 2015; Krivokapié, 2012)。 这 些 线索 是 (1) 音 
高 变化 ， 即 通过 音 高 上 升 、 音 高 下 降 或 者 再 设 ( 下 
降 后 再 上 升 回 复 到 原 有 高 位 ) 表 示 边 界 音 的 存在 
(也 称 为 了 ,二 者 的 区 别 在 于 前 者 从 感知 的 角度 ， 
而 后 者 从 发 音 的 角度 进行 描述 ); (2) 音 长 ， 即 边界 
前 词语 延长 的 持续 时 间 ; (3) 停 顿 ， 即 两 个 韵律 单 
位 之 间 的 间隔 性 中 断 (Minnel & Friederici, 2016)。 
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研究 者 对 韵律 层级 与 语法 层级 的 关系 进行 了 
一 定 的 研究 , 认为 两 者 相关 却 又 不 是 一 一 对 应 。 
有 研究 者 认为 ,， 韵律 层级 和 句法 结构 之 间 存 在 着 
映射 关系 ， 每 个 韵律 层级 都 有 相应 的 句法 单位 存 
在 ,韵律 结构 边界 和 句法 结构 边界 常常 一 致 ,， 尤 
其 是 在 朗读 中 。 据 此 现象 , Truckenbrodt (1995) 提 
出 了 Generalized Wrap 理论 ， 认 为 语调 短语 边界 
倾向 于 不 打破 句法 短语 ， 即 韵律 边界 与 句法 节点 
保持 一 致 。 但 Frazier 等 人 (2004) 的 研究 分 别 以 语 
法 节点 和 意思 单元 (sense unit) 为 条 件 来 操控 语调 
短语 边界 位 置 ， 以 语句 自然 度 判断 为 任务 ， 发 现 
句法 节点 不 是 韵律 边界 位 置 的 绝对 性 限定 因素 。 
显然 ,韵律 结构 的 复杂 度 远 远 小 于 句法 结构 ， 也 
使 得 韵律 边界 和 句法 边界 之 间 的 关系 不 可 能 是 单 


Hindle, 1990) 韵律 边界 的 加 工 是 依据 紧 依 着 边界 
的 韵律 线索 ,无 须 其 他 的 韵律 信息 。 因 而 ,韵律 边 
界 的 加 工 也 是 局 部 的 ,独立 于 上 下 文 的 。 上 述 关 
于 边界 感知 权重 线索 的 研究 都 基于 该 观点 。 另 一 
种 观点 则 认为 ,韵律 边界 的 加 工 是 整体 性 的 ， 相 
邻 韵 律 短语 边界 的 强度 会 影响 韵律 边界 的 感知 。 
例如 , old men#1 and women # 2 with very large houses 
这 样 的 口头 语句 中 ， 如 果 #1 处 的 边界 强度 大 于 #2 
处 的 边界 强度 , 那么 该 短语 的 意思 是 “老年 男士 
们 和 拥有 豪宅 的 女士 们 ” 句 中 并 没有 包含 老年 
男士 们 有 没有 豪宅 的 信息 ; 如 果 # 处 的 边界 强度 
大 于 #1 处 的 边界 强度 , 那么 其 意思 就 变 成 了 “ 拥 
有 豪宅 的 老年 男士 们 和 (老年 ) 女 士 们 ” 女士 们 也 


纯 的 一 对 一 关系 。 除 此 之 外 ,日 常 经 验 显示 ， 自 然 
谈话 中 效 律 边界 和 句法 边界 的 关系 更 加 松散 。 这 
类 语言 现象 中 又 蕴含 着 怎样 的 规律 ， 有待 进 一 步 
发 气 。 

3 ”韵律 边界 的 加 工 线 索 


在 语音 听 辨 的 过 程 中 ,虽然 多 个 声学 线索 同 
时 呈现 ,但 是 听 者 根据 声学 线索 所 具有 的 分 辩 力 
而 被 赋予 不 同 的 权重 , 这 一 理论 即 言语 感知 线索 


用 有 豪宅 (Clifton et al., 2002)。 也 就 是 说 ,听话 人 
需要 在 整体 框架 下 加 工 韵律 边界 的 线索 。 

研究 者 还 对 韵律 边界 加 工 和 句法 加 工 的 关系 
进行 了 探讨 。 韵 律 边界 是 切 分 语 流 的 组 织 框架 ， 
句法 是 语言 组 织 的 规则 ， 二 者 都 具备 组 织 功能 ， 
因此 相互 影响 。 一 方面 , 句法 对 语调 边界 感知 有 
预测 作用 。Cole 等 人 (2010) 根 据 Buckeye 语料库 
的 数据 和 97 名 被 试 对 上 述 语 料 的 转 写 结果 ， 发 现 
从 句 的 句法 边界 是 最 强大 的 边界 感知 预测 指标 。 
Bux6-Lugo 和 Watson (2016) 进一步 发 现 句 法 短 


权重 理论 (Qin et al., 2016)。 根 据 这 一 理论 ， 言语 
感知 是 多 维度 的 , 不 同 的 范畴 、 不 同 的 语言 赋予 
声学 线索 不 同 的 权重 ， 因 而 成 为 边界 声学 线索 感 
知 研究 的 重要 理论 。 

成 人 母语 者 对 韵律 边界 声学 线索 的 利用 是 语 
言 特异 性 的 。 比 如 ,英语 母语 者 在 判断 从 名 边界 
时 ,对 界 前 音素 延长 的 倚赖 多 于 停顿 (Aasland & 


语 边 界 位 置 的 期 望 也 影响 语调 边界 的 感知 : 被 试 
在 句法 许可 位 置 上 对 韵律 边界 的 感知 效率 要 显著 
高 于 句法 不 许可 位 置 的 韵律 边界 。 例 如 ,在 口头 
句子 (1) Put the big#1 bowl on the tray 和 (2) Put the 
bowl that’s big#2 on the tray 中 ， 分 别 于 big 之 后 设 
HWER. PEAH 处 为 句法 不 许可 处 , #2 
则 为 句法 许可 处 。 借 助 声学 软件 合成 不 同 强度 的 


Baum，2003)， 而 对 于 汉语 母语 者 来 说 ,停顿 是 最 
重要 的 边界 线索 (Yang et al., 2014)。 德语 母语 者 使 
用 停顿 的 范畴 和 界 前 音素 延 时 来 判断 边界 ， 而 对 
音 高 的 倚重 次 之 (Petrone et al., 2017)。 值 得 一 提 的 
是 , 韵律 边界 感知 研究 采用 的 方法 多 是 用 某 个 线 
索 的 去 留 来 判断 其 重要 性 , 忽视 了 可 能 存在 的 声 
FRE. BY, 在 某 个 范围 内 , 某 个 声学 线索 是 有 效 的 ， 
范围 之 外 则 失去 效力 。Petrone 等 人 (2017) 首 次 使 
用 浆 值 的 概念 来 探讨 声学 线索 的 权重 ， 为 后 来 的 
研究 提供 了 一 个 新 的 方向 : 我 们 可 以 进一步 从 范 
畴 性 和 连续 性 的 角度 深化 边界 线索 知觉 的 研究 。 
关于 韵律 边界 加 工 是 基于 局 部 线索 还 是 整体 
线索 也 存在 争议 。 一 种 观点 认为 (e.g. Marcus & 


韵律 边界 (改变 FO 的 廓 形 、 停 顿 的 时 长 和 界 前 元 
音 的 延长 比率 )。 结 果 发 现 ， 被 试 对 韵律 边界 判断 
的 实验 任务 中 , 不 论 在 哪个 韵律 边界 强度 等 级 下 ， 
被 试 在 许可 处 报告 韵律 边界 的 比例 总 是 要 多 于 不 
许可 处 。 该 结果 说 明 听 话 人 对 韵律 边界 的 检测 
不 是 严格 地 由 听觉 因素 驱动 ， 而 是 受 句法 因素 影 
响 的 。 结 构 明 晰 的 句法 也 被 证 明 能 够 促进 韵律 边 
界 的 感知 (Honbolygo et al., 2016). 

另 一 方面 ,韵律 边界 影响 口头 句子 的 结构 解 
析 。Kjelgaard 和 Speer (1999) 的 实验 使 用 花园 路 
径 句 作为 语言 材料 ， 发 现 恰当 的 韵律 边界 能 够 克 
服 句 法 歧义 。 作 者 认为 这 是 因为 在 语句 加 工 的 过 
程 中 ,韵律 边界 充当 了 句子 结构 的 指示 器 。 这 个 
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研究 似乎 提示 韵律 边界 是 句法 结构 在 语音 层面 上 
的 表征 。 通 过 韵律 ,我 们 得 以 完 见 深层 次 的 句法 
结构 信息 。 这 个 效应 在 Steinhauer 等 人 (1999) 的 研 
究 中 再 次 得 到 ERP 证 据 的 证 实 。 随 后 ,边界 删除 
假说 (Boundary Deletion Hypothesis) 强化 了 韵律 
边界 在 句法 解析 中 的 作用 : 如 果 在 一 个 本 不 该 有 
韵律 边界 的 地 方 增加 了 一 个 边界 ,那么 所 需要 的 
时 间 比 错过 一 个 韵律 边界 ( 即 ， 本 该 停顿 却 没有 停 
顿 ) 更 多 (Pauker et al., 2011; Bégels et al., 2013)。 这 
些 研究 似乎 暗示 在 口语 中 韵律 结构 对 句子 结构 解 
析 的 作用 要 先 于 句法 引发 的 解析 , 在 句子 理解 中 
不 是 仅仅 为 辅助 的 角色 。 之 后 , Webman-Shafran 
和 Fodor (2016) 的 研究 发 现 , 在 加 工 双 介词 短语 
结构 (pp-construction) 的 短 句 如 hid his anger about 
the divorce from Tami 时 ， 如 果 第 二 个 介词 短语 


Th 


解 的 加 工 过 程 中 韵律 边界 通过 韵律 组 块 (prosodic 
chuncking) 的 方式 参与 句法 解析 (syntactic parsing), 
影响 听话 人 对 句子 意思 的 理解 。 具 体 来 说 ， 听 话 
人 首先 知觉 声学 特征 然后 投射 到 句子 的 结构 上 ， 
TE RRI HE H IR (chunking), 产生 句子 结构 的 解析 
结果 。 然 而 ， 现 有 基于 模块 论 的 加 工 模型 忽略 了 
口语 韵律 在 其 中 的 作用 。 对 于 口语 加 工 ,， 背 律 边 
界 同样 能 够 起 到 切 分 不 同 句 法 成 分 的 作用 ， 从 而 
促进 词汇 在 不 同位 置 、 句 法 角色 的 分 配 ， 所 以 应 
当 考虑 纳入 韵律 规则 来 更 新 模型 。 另 一 方面 ， 对 
于 交互 论 而 言 ， 韵律 边界 显然 对 语言 学 的 句法 解 
析 有 限制 和 引导 作用 ,二 者 并 行 参与 在 线 句 子 加 
T, 其 核心 观点 得 到 支持 。 但 是 , 韵律 和 其 他 维度 
信息 之 间 的 交互 和 整合 是 如 何 开 展 的 ,值得 深入 
探究 。 总 的 来 说 ,传统 的 句子 加 工 模型 主要 关注 


(from Tami) 前 有 韵律 边界 ,那么 听话 人 倾向 于 将 
第 二 个 介词 短语 作为 hid 的 修饰 语 ( 即 , high attachment 
高 附着 ); 如 果 没 有 , 则 将 它 当 成 是 the divorce 的 
修饰 语 ( 即 , low attachment 低 附 着 )。 显然， 这 个 结 
果 挑 战 了 语言 学 中 的 晚 团 合 原 则 。 根 据 晚 闭合 原 
则 ， 双 介词 结构 中 的 第 二 个 介词 短语 应 该 是 低 附 
着 的 ( 即 修饰 最 近 的 单位 ), 但是， 由 于 韵律 边界 
的 存在 ， 第 二 个 介词 结构 的 附着 就 变 得 有 两 个 可 
能 : 若 第 二 个 介词 结构 前 不 存在 韵律 边界 ， 听话 
人 采用 低 附着 的 句法 结构 解析 方案 ; 若 存 在 一 个 
韵律 短语 边界 的 时 候 ， 听 话 人 则 倾向 于 采用 高 附 
着 的 方案 (Webman-Shafran & Fodor, 2016)。Webman- 
Shafran 和 Fodor (2016) 的 人 研究 似乎 更 进一步 凸显 
了 韵律 边界 在 句子 理解 中 的 作用 一 一 它 着 实 决 定 
了 句子 的 结构 和 句 意 。 这 样 的 结果 让 我 们 理解 前 
律 边界 在 句子 加 工 中 的 角色 变 得 更 为 复杂 , 但 是 
也 给 句子 加 工 模 型 带 来 了 新 的 视角 。 

模块 论 (Module Approach) 和 交互 论 (Interactive 
Approach) 分 别 是 针对 句子 加 工 机 制 的 两 大 理论 
流派 。 模 块 论 的 主要 观点 是 听话 人 在 加 工 句 子 时 ， 
首先 根据 语言 学 的 句法 建立 句子 的 结构 框架 ， 然 
后 再 将 词语 分 配 到 不 同 的 句法 位 置 上 , 最 后 提取 
语义 合成 句 意 。 交 互 论 的 主要 观点 则 认为 对 句法 


语言 学 句法 和 词汇 意义 在 句子 加 工 中 的 贡献 ， 而 
关于 韵律 边界 和 句法 交互 关系 的 讨论 将 对 拓展 已 
有 的 口语 句子 加 工 方法 论 (关于 模块 轮 和 交互 论 
的 一 些 具体 模型 可 参见 Clahsen & Felsh, 2017) 有 
重要 的 启迪 意义 。 


4 ”韵律 边界 加 工 的 神经 响应 


最 近 十 几 年 , 研究 者 特别 关注 韵律 边界 加 工 
的 神经 响应 ， 从 神经 层面 上 探讨 韵律 边界 是 如 何 
被 人 类 听觉 系统 获取 而 用 以 促进 语音 感知 的 ， 以 
及 其 背后 的 认 知 神经 机 制 是 如 何 的 。 
41 CPS 与 韵律 边界 加 工 
首先 , 研究 者 提出 的 关键 问题 是 ,韵律 边界 
是 一 种 独立 的 加 工 机 制 , 还 是 口语 加 工 过 程 中 的 
“副产品 ”? 换言之 , 对 于 韵律 边界 的 加 工 是 否 存 
在 特异 性 的 认 知 神经 机 制 呢 ?对 此 , 研究 者 采用 
ERP (Event-related Potential, 事件 相关 电位 ) 技 术 
进行 了 回答 Steinhauer 等 人 (1999) 在 Nature 的 子 
刊 Neuroscience 杂志 上 首次 报告 了 韵律 边界 加 工 
的 特异 性 脑 电 成 分 CPS (Closure Positive Shift, [4] 
合 正 偏 移 成 分 )。 该 研究 要 求 20 名 大 学 生 被 试 在 
实验 中 完成 判断 韵律 是 否 恰当 的 任务 。 结 果 发 现 
在 语调 边界 处 存在 特异 性 的 脑 电 成 分 ,这 种 成 分 


Iinl 


ANSE IE 1 COA MT SCBA AP ESDA FE: 
行 的 。 现 有 模型 强调 语义 / 语 用 的 贡献 ， 对 韵律 
贡献 的 讨论 非常 少 ( 两 种 理论 总 是 交替 成 为 相关 
领域 的 主流 理论 ， 其 钟 摆 式 历史 可 参见 Clifton & 
Duffy,，2001)。 然 而 由 上 文 所 述 可 见 , 口语 句子 理 


潜伏 期 为 400~500 ms， 分 布 于 头皮 中 后 部 。 为 了 
剥离 语义 和 句法 因素 的 影响 ,验证 CPS 的 特异 性 ， 
Pannekamp 等 人 (2005) 使 用 ERP 技术 开展 了 实验 ， 
分 别 检 测 被 试 对 4 种 信息 量 逐 次 递减 的 句子 的 加 
工 。 这 4 种 句子 分 别 是 : (1) 正 常 句子 ; (2) 无 意义 
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名 (jabberwocky sentence), 句子 中 的 实 词 被 假 词 
替代 ,无 语义 信息 ; GURA (pseudo sentence), 4J 
子 中 的 实 词 和 功能 词 被 假 词 蔡 代 ,， 无 句法 和 语义 
信息 ; (4) 喻 鸣 句 (hummed sentence)， 整 个 句子 由 
喻 喻 声 组 成 ,只 有 韵律 信息 。 实 验 结果 显示 ,在 每 
一 种 句子 的 韵律 短语 边界 ， 都 观察 到 了 CPS 成 分 ， 


用 (entrainmenb， 认 为 大 脑 神 经 振荡 活动 如 同 “ 神 
经 录音 器 ?" 般 在 神经 系统 上 还 原 语 音 的 节律 变化 。 
基于 这 一 机 制 ， 听觉 系 统 得 以 获得 韵律 边界 知觉 ， 
将 输入 的 长 语音 流 切 分 为 小 尺度 的 语音 单元 进行 
加 工 。“ 夹 带 ” 作 用 被 证 明 能 够 优化 语音 理解 过 程 ， 
听 有 意义 语音 时 “夹带 ”作用 强 于 听 无 意义 语音 ， 


包括 只 有 喻 喻 声 的 句子 。 研 究 结果 说 明 在 句法 、 
语义 信息 缺乏 的 情况 下 ， 仍 会 诱发 CPS 成 分 ， 即 
韵律 边界 的 加 工 是 独立 于 名 法、 语义 和 音素 的 加 
工 单独 存在 的 。Honbolygo 等 人 (2016) 分 别 以 嵌入 
句 名 型 (如 , The grandfather, who entered, was thirsty.) 


且 低 频段 的 “夹带 ”作用 能 够 预测 语音 理解 成 绩 
(Gross et al., 2013; Park et al., 2015). 

尽管 “夹带 ”作用 与 韵律 边界 感知 密切 相关 ， 
但 其 背后 反映 的 加 工 机 制 仍 是 不 明确 的 。 一 种 观 
点 认为 “夹带 ”作用 纯粹 是 声学 包 络 引起 的 ， 而 和 


的 真 句 和 假名 为 刺激 材料 进一步 验证 了 韵律 边界 


语言 信息 的 理解 无 必然 的 联系 。 他 们 发 现 人 们 在 


的 感知 是 独立 存在 的 。CPS 还 被 证 明 具 有 跨 语言 
的 普遍 性 。 例 如 ， 在 英语 (e.g., Pauker et al., 2011; 
Steinhauer et al., 2010), 7a ~“if(e.g., Bögels et al., 
2010)， 中 文 (Li & Yang, 2009) 和 韩语 中 (Hwang & 
Steinhauer, 2011) 都 被 证 实 存在 CPS. 

为 了 进一步 探究 CPS 与 不 同 层 级 韵律 边界 的 
KA, Li 和 Yang 采用 了 中 文句 子 (2009) 为 材料 ， 
发 现 不 同 层 级 韵律 边界 均 能 够 稳定 地 诱发 CPS, 
即使 在 去 除了 边界 处 停顿 线索 的 情况 下 ，CPS 仍 
然 存在 。 并 且 , CPS 的 潜伏 期 和 韵律 层级 之 间 存 在 
系统 性 变化 ， 即 随 着 韵律 层级 的 增加 (韵律 短语 、 
语调 短语 、 小 句 边 界 、 联 句 边界 )，CPS 潜伏 期 增 
加 。 这 表明 ， 人 脑 不 仅 能 够 独立 地 感知 韵律 边界 ， 
且 能 够 对 韵律 边界 的 不 同 层 级 进行 特异 性 表征 ， 
从 而 将 长 语音 流 切 分 、 整 合 为 多 层级 扔 套 的 语言 
结构 。 
42 大脑 神经 振荡 活动 与 韵律 边界 加 工 

CPS 反映 了 与 韵律 边界 处 相关 的 、 锁 时 锁 相 
的 神经 反应 ,而 大 脑 神经 振荡 活动 (neural 
oscillation) 则 能 够 进一步 揭示 大 脑 锁 时 非 锁 相 的 
节律 性 神经 活动 , 更 直观 地 反映 大 脑 对 听觉 语音 
信号 中 韵律 边界 的 感应 活动 。 研 究 者 采用 EEG 和 


听 不 可 理解 的 倒转 语音 时 也 能 够 产生 “夹带 ”作用 
(Howard & Poeppel, 2010)。 另 一 个 观点 则 支持 “ 夹 
带 ” 和 “语言 理解 "存在 密切 关系 ,认为 “夹带 ”只 在 
可 懂 语 音 条 件 下 产生 、 或 在 高 可 懂 度 条 件 下 “ 夹 
”作用 更 强 (e.g. Gross et al., 2013; Park et al., 
2015)。 例 如 ，Doelling 等 人 (2014) 采 用 语言 (delta 
节律 呈现 的 数字 序列 , 3 Hz 左右 ) 作 为 材料 ， 发 现 
去 除 与 节律 信息 有 关 的 波动 线索 后 ， 大脑 对 delta 
频段 (2~4 Hz) 的 “夹带 ”活动 显著 降低 ， 而 加 入 能 
量 波动 线索 后 “夹带 ”得 到 了 恢复 。 除 此 之 外 ,这 一 
“夹带 ?活动 强度 还 与 听 者 对 语音 尖锐 度 (sharpness) 
和 可 懂 度 (intelligibility) 的 感知 评分 存在 正 相 关 关 
系 。 针 对 该 类 “夹带 ”在 言语 理解 中 的 机 制 , Giraud 
和 Poeppel (2012) 提 出 了 基于 神经 振荡 的 层级 绑 
xe 模 型 (Oscillation-based Hierarchical Binding 
Model)， 认 为 语音 单元 左边 界 (edge) 上 的 包 络 调 
频 信号 输入 ,能 够 引起 听觉 系统 delta-theta 频段 
(1~8 Hz) 神 经 振荡 活动 的 相位 重 设 (phase reset), 
进而 调整 gamma 频段 (30~70 Hz) 神 经 振荡 活动 波 
幅 , 使 神经 兴奋 活动 起 伏 与 语音 声学 包 络 的 起 伏 
相对 齐 , 为 加 工 随后 而 来 的 语音 信息 提供 了 “时 
间 框 架 ” 与 “神经 兴奋 性 准备 ”。 在 这 一 过 程 中 ,大 


ae 


MEG 记录 被 试听 语音 时 的 脑 电 信号 ,发 现 听 语音 
时 ， 人 类 大 脑 听 皮层 的 神经 振荡 活动 与 低频 段 
(<10 Hz) 语 音 包 络 存 在 较 强 的 同步 节律 变化 (e.g. 
Brodbeck et al., 2018; Ding et al., 2015; Ding et al., 
2018)， 这 一 频段 对 应 于 韵律 边界 划分 的 不 同 语言 
层级 的 节律 ， 例 如 delta 频段 (0~3 Hz) 的 调制 包 络 
与 句子 或 短语 节律 有 关 , theta (4~10Hz) 的 调制 包 
络 与 音节 节律 有 关 (Poeppel, 2003)。 研究 者 将 这 一 
机 制 形象 地 喻 为 大 脑 对 语音 信号 产生 的 “夹带 ” 作 


脑 听 皮 层 实现 对 语音 信号 包 络 的 同步 “ 调 协 ”产生 
“夹带 ”作用 ， 从 而 得 以 将 语音 流 信 号 信息 进行 切 
分 与 解码 。 

对 声学 包 络 信号 的 自 下 而 上 “解析 ”加 工 并 非 
引起 “夹带 ”作用 的 唯一 原因 ， 某 些 自 上 而 下 的 过 
程 被 证 明 也 能 引起 大 脑 对 语音 的 “夹带 ”作用 。 例 
W, Ding 等 人 (2015) 考 察 了 去 除 韵律 边界 声学 线 
索 时 是 否 仍 然 存在 “夹带 ”作用 。 他 们 采用 固定 节 
奏 的 四 字 中 文 短 句 为 材料 (如 : 绵羊 吃 草 ), 使 得 音 
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节 、 词 汇 和 句子 节律 分 别 为 4Hz、2 Hz 和 1 Hz， 仅 
保留 语义 和 句法 线索 ， 而 去 除 韵 律 边界 处 停顿 、 
边界 前 音节 延长 等 声学 线索 。 基 于 神经 振荡 活动 
的 分 析 发 现 , 在 不 同 层 级 语音 结构 对 应 的 节律 上 
均 产 生 了 显著 的 “夹带 ”活动 (4、2、1 Hz). Ding 
和 Jin (2019) 的 研究 进一步 表明 “夹带 ”作用 与 基于 
句法 或 任务 的 语音 组 块 规律 有 关 ， 而 并 非 加 工 词 
汇 语义 联系 的 副 产 物 。 在 鸡尾酒 会 中 ,， 听 者 对 “ 注 
意 ” 语 流 的 “夹带 "效果 更 好 (Brodbeck et al., 2018; 
Ding et al., 2018)。 男 一 些 研究 证 据 则 从 声学 线索 
的 角度 说 明 ,， 除了 语音 包 络 上 的 调频 节律 信息 ， 
与 韵律 边界 无 关 的 、 仅 表征 “ 音 位 ”特征 的 精细 频 
率 信息 也 能 够 导致 “夹带 ”作用 的 产生 (Ding et al., 
2014; Zoefel & VanRullen, 2015, 2016)。 以 上 研究 
结果 表明 ， 自 上 而 下 的 语音 、 语 义 和 句 法 分 析 过 
程 以 及 选择 性 注意 都 能 够 调控 语音 流 切 分 的 神经 
活动 , 从 而 导致 夹带 ”作用 的 产生 .这 些 结果 表明 ， 
大 脑 不 同 频段 神经 振荡 活动 的 “夹带 ”作用 ， 更 可 
能 是 大 脑 基于 自 下 而 上 加 工 与 自 上 而 下 调控 的 交 
互 过 程 进行 语音 流 切 分 和 重组 的 “混合 
(mixture)， 也 即 大 脑 对 语音 包 络 的 “夹带 ”作用 也 
包含 某 些 “主动 ”的 感知 加 工 过 程 。 

那么 ,“ 夹 带 ” 作 用 是 否 也 反映 “韵律 边界 "本 
身 的 自 上 而 下 加 工 过 程 呢 ?已 有 的 一 些 研究 证 据 
表明 ,“ 夹 带 ” 作 用 与 对 韵律 边界 的 时 间 预 期 的 确 
存在 相关 。 研 究 者 将 连续 语音 流 分 为 语 境 (context) 


对 目标 词 的 语音 感知 结果 产生 影响 。 这 些 结果 提 
示 ,“ 夹 带 ” 作 用 不 仅 与 语音 声学 包 络 的 自 下 而 上 
加 工 有 关 , 还 可 能 反映 自 上 而 下 的 、 主 动 的 时 间 
预期 对 韵律 边界 感知 的 影响 。 

在 此 基础 上 , 研究 者 试图 从 “夹带 ”这 一 “混合 
物 ” 中 分 离 出 与 韵律 边界 的 自 上 而 下 加 工 机 制 有 
关 的 频段 、 时 间 进 程 与 脑 网 络 特点 。Park 等 人 
(2015) 发 现 delta 频段 和 theta 频段 神经 振荡 活动 可 
能 与 韵律 边界 的 自 上 而 下 加 工 有 关 。 他 们 让 被 试 
聆听 7 分 钟 的 故事 语音 , 同时 记录 了 MEG 信号， 
基于 因果 性 时 间 相 关 分 析 ， 以 听 倒 转 语音 为 基线 
条 件 ,， 采 用 在 一 定时 间 延 迟 条 件 下 其 他 脑 区 对 听 
皮层 脑 区 的 神经 信号 相位 的 预测 性 作为 该 脑 区 对 
听 皮 层 进行 自 上 而 下 调控 的 神经 指标 (TDI, top-down 
index)。 结 果 发 现 ， 锁 时 在 韵律 边界 处 (edge) 进 行 
分 析 发 现 , 不同 脑 区 对 左 侧 听 皮层 的 调控 作用 分 
别 在 边界 前 或 边界 后 达到 峰值 ， 研 究 者 推测 这 可 
能 与 各 脑 区 在 时 间 预 期 中 扮演 的 角色 有 关 。 左 侧 
额 下 回 脑 区 可 能 通过 delta 频段 振荡 活动 调控 左 
侧 听 皮层 活动 ， 在 实际 声学 信号 输入 前 产生 时 间 
预期 ， 而 左 侧 运动 前 区 和 右 侧 额 -里 联合 区 可 能 
基于 边界 后 已 经 输入 的 声学 信号 ， 通 过 theta 频段 
振荡 活动 实时 调控 时 间 预 期 的 匹配 过 程 ， 进 行 时 
间 预 期 模型 的 更 新 。 遗 憾 的 是 , 该 研究 没有 对 前 
律 边界 的 声学 线索 、 韵 律 层级 或 其 它 自 上 而 下 因 
素 进行 操 纵 ， 无 法 为 韵律 边界 的 时 间 预 期 提供 直 


和 目标 短语 (target word), 发 现 听 者 能 够 基于 语 境 
中 韵律 边界 的 划分 规律 ， 对 之 后 的 语音 边界 进行 
预测 。 例 如 , Dilley 和 Pitt (2010) 采 用 功能 词 有 无 
不 影响 通顺 度 的 语句 为 材料 (e.g. Deena doesn’t 
have any leisure or time...), 将 语 境 部 分 (Deena 


= 


接 证 据 。Kayser 等 人 (2015) 以 故事 语音 为 材料 ， 操 
纵 了 语音 之 间 “ 停 顿 ”(pause) 的 变异 性 Gitter)， 变 
化 率 设置 为 0%、30%、60% 和 90%, 而 保持 总 体 
节律 和 可 理解 性 不 变 。 锁 时 在 异常 “停顿 ”与 之 后 
词汇 起 音 (onseb 的 边界 处 进行 分 析 发 现 ,在 边界 前 


doesn’t have any lei...) 节 律 放 慢 (时 长 为 原 时 长 
的 1.9 倍 ) 而 目标 短语 节律 不 变 (-sure or time) 时 ， 
或 语 境 部 分 节律 不 变 而 将 目标 词 节律 加 快 (时 长 
为 原本 的 0.6 倍 ) 时 ， 受 到 语 境 节 律 的 影响 ， 被 试 
更 倾向 于 认为 后 级 “-sure” 与 功能 词 “or” 之 间 无 边 
界 ， 而 更 少 报告 听 到 了 “or”， 同 时 改变 语 境 与 目 
标 词 的 节律 时 , 被 试 报告 听 到 “or” 的 概率 与 正常 
语 速 无 差异 (类 似 结果 见于 Maslowski et al., 2019)。 
Kösem 和 van Wassenhove (2016) 采 用 MEG 记录 方 
法 在 神经 水 平 上 进行 了 重复 ,发现 语 境 节律 不 
变 、 而 目标 词 节律 突然 发 生 改 变 时 ， 原 有 语 境 边 
界 节 律 引发 的 “夹带 作用 ” 仍 会 持续 一 段 时 间 ， 并 


(-0.16 ~ -0.06 s) 左 前 额 脑 区 alpha 频段 (8~12 Hz) 
能 量 降 低 , 在 边界 后 额 - 杜 脑 区 delta 频段 (0.5~2 Hz) 
神经 振荡 活动 和 语音 包 络 之 间 的 相位 一 致 性 降低 ， 
即 对 底层 输入 信息 的 “夹带 ”作用 减弱 ， 且 二 者 存 
在 显著 正 相 关 ， 其 他 频段 对 语音 包 络 的 “夹带 ” 活 
动 和 ERP 效应 与 正常 条 件 相 比 无 显著 差异 。 这 一 
结果 表明 ,在 语音 边界 的 声学 信号 输入 前 ， 左 侧 
前 额 脑 区 可 能 就 已 经 产生 了 韵律 边界 时 间 预 期 
(alpha 频段 能 量 降低 )， 并 将 预期 信号 传 至 听觉 感 
知 脑 区 ， 从 而 实时 调控 韵律 边界 的 在 线 加 工 的 过 
FE, delta 频段 神经 振荡 活动 可 能 是 大 脑 基 于 语音 
节律 对 韵律 边界 进行 时 间 预 期 的 产物 ， 而 与 自 下 
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而 上 声学 信号 加 工 相 对 无 关 。 以 上 研究 结果 揭示 ， 
前 额 叶 脑 区 到 桔 叶 脑 区 的 感知 -运动 系统 可 能 参 
与 韵律 边界 的 自 上 而 下 时 间 预 期 过 程 ， 并 通过 前 
I alpha 频段 AB delta 频段 或 theta 频段 
神经 振荡 活动 对 语音 流 的 在 线 切 分 起 调控 作用 。 
对 于 韵律 边界 的 自 上 而 下 预期 机 制 , 研究 者 


早 闭 合 结构 ， 则 Pat 之 后 的 边界 并 没有 诱发 CPS, 
如 果 将 结构 解析 为 (Pat or Jay) and Lee, 则 Jay 之 
后 诱发 了 CPS。 对 于 这 一 结果 ,作者 认为 CPS Ie 
映 了 句子 理解 过 程 中 韵律 边界 信息 的 整合 ， 也 即 ， 
边界 是 否 被 用 于 句子 理解 才 是 诱发 CPS 的 关键 。 

然而 , Pannekamp 等 人 (2005) 证 实 CPS 是 独立 于 语 


较 少 从 理论 角度 进行 深入 阐释 。 然 而 ,以 上 研究 
结果 发 现 ， 听 者 自 下 而 上 的 感知 加 工 过 程 及 其 结 
果 会 受到 自 上 而 下 预期 加 工 的 影响 ,这 可 能 反映 
了 一 种 “合成 * 分 析 ” 加 工 过 程 。“ 合 成 * 分 析 ” 理 论 
(Analysis-by-Synthesis Hypothesis: Halle & Stevens, 
1962) 认 为 ， 听 者 会 基于 对 已 获得 的 (声学 或 语言 
学 ) 语 境 信息 的 分 析 ,“ 合 成 ?对 即 临 声音 信号 模式 
的 假设 。 在 实际 信号 输入 后 ， 听 者 基于 内 部 模型 
的 “预期 ”信号 与 外 部 输入 的 信号 进行 “分 析 ” 从 
而 获得 对 长 时 程 语 流 的 实际 感知 结果 。 当 二 者 匹 
配 时 ， 则 能 够 促进 感知 加 工 过 程 。 基 于 “合成 * 分 


言 信 息 存 在 的 ， 该 说 法 与 之 冲突 。 因 此 ,整合 一 说 
似乎 不 足以 解释 。 另 一 种 可 能 是 一 定 长 度 的 语音 
结构 边界 才能 诱发 CPS， 如 韵律 短语 层级 及 以 上 
(e.g. Li & Yang, 2009), 这 一 解释 与 Hwang 和 Steihauer 
(2011) 所 开展 的 隐 性 韵律 研究 所 得 结果 一 致 ,在 大 
脑 神经 振荡 活动 中 ,韵律 短语 及 以 上 层级 对 应 于 
delta 频段 (0~3Hz)， 这 一 频段 的 “夹带 ”作用 被 证 明 
在 韵律 边界 的 自 下 而 上 追踪 (e.g. Doelling et al., 2014; 
Brodbeck et al., 2018) 和 自 上 而 下 预期 (e.g. Kayser 
et al., 2015; Park et al., 2015) 中 扮演 了 重要 角色 。 
鉴于 CPS 和 delta 频段 神经 振荡 活动 都 与 短 


析 ” 理 论 ， 对 韵律 边界 的 自 上 而 下 加 工 与 自 下 而 
上 加 工 存在 动态 的 交互 过 程 。 当 一 段 语句 或 对 话 
展开 时 , 听 者 可 能 基于 其 长 时 程 的 韵律 特点 “ 合 
成 ”对 韵律 边界 出 现时 间 的 预期 模型 ， 并 基于 预 
期 模型 对 自 下 而 上 输入 的 韵律 边界 感知 产生 即时 
影响 ， 如 改变 对 连续 语 流 的 切 分 方式 (e.g. Dilley 


语 及 以 上 韵律 层级 的 边界 感知 有 关 ， 其 背后 反映 
的 认 知 意义 是 如 何 的 呢 ? 结合 自然 语言 的 节奏 特 
点 及 大 脑 对 语言 加 工 的 特点 ， 二 者 实际 上 可 能 反 
映 了 大 脑 以 短语 为 组 块 (chunking) 切 分 语音 流 的 
有 好。 语料库 分 析 结 果 显 示 ， 人 类 语言 中 语调 短 
语 ( 即 一 个 语调 韵律 单位 ) 是 4~8 个 音节 居多 (周游 ， 


=> 


& Pitt, 2010; Maslowski et al., 2019) 或 提高 语音 感 
知 质量 (e.g. Park et al., 2015)。 在 语义 、 句 法 加 工 
E, 这 种 “合成 * 分 析 ” 方 式 已 被 证 明 能 够 提高 口语 
加 工效 率 , 那么 对 韵律 边界 的 加 工 是 否 也 遵循 
“合成 * 分 析 ” 过 程 呢 ? 对 韵律 边界 的 自 上 而 下 加 
工 机 制 和 自 下 而 上 加 工 机 制 的 交互 过 程 是 如 何 
的 、 是 否 存 在 时 空 特点 上 的 分 离 ? 这 些 问题 仍然 
有 待 研究 。 
4.3 CPS 与 神经 振荡 的 关系 

CPS 和 低频 段 的 大 脑 神经 振荡 活动 都 是 韵 得 
边界 感知 的 重要 神经 指标 ,近来 的 研究 进一步 提 
示 二 者 之 间 可 能 存在 一 定 的 对 应 关系 ， 即 他 们 都 
对 短语 层级 以 上 的 韵律 边界 更 为 敏感 。 一 些 研究 
者 发 现 ， 对 于 韵律 边界 加 工 引 起 的 CPS 效应 , FF 
在 “长 度 限制 效应 ”， 即 CPS 效应 在 特定 语音 结构 
长 度 的 边界 处 才 会 产生 。Li 和 Yang (2009) 采 用 中 
文句 子 为 材料 发 现 , 在 韵律 词 边界 处 未 诱发 显著 
的 CPS. 类似 地 , Holzgrefe 等 人 (2013) 利 用 并 列 名 
单 (Pat or Jay and Lee) 作 为 实验 的 语言 材料 ， 发 现 
如 果 是 将 结构 解析 为 (Pat) (or (Jay and Lee))， 即 


I 


刘 方舟 , 2017)， 而 这 一 节律 恰好 与 delta 频段 节律 
相对 应 。 根 据 神 经 认 知 研究 结果 ,大 脑 对 外 部 信 
息 存 在 两 个 优势 的 整合 时 间 窗 口 ， 分 别 为 150~ 
300 ms 的 短 时 窗 ( 右 偏 化 ) 和 3 s 的 长 时 窗 ， 对 应 于 
theta 频段 (4~8 Hz), delta 频段 (0~3 Hz) 的 神经 振 
荡 活 动 ( 杨 玉 芳 , 2015)， 这 些 频 段 (尤其 是 delta 频 
段 ) 被 证 明和 韵律 边界 的 时 间 预 期 有 关 。 一 项 固定 
步 速 阅读 研究 发 现 ， 人 们 在 阅读 时 也 会 在 短语 边 
界 产生 CPS, FCPS 以 2~3 s 为 周期 循环 出 现 (Roll 
et al., 2012; Schremm et al., 2015), = delta 频段 节 
律 一 致 。 这 些 研究 提示 ,基于 日 常 口语 中 语音 组 
块 的 节奏 规律 ,大 脑 可 能 倾向 于 以 一 定 的 语音 结 
构 长 度 组 块 (如 :短语 ) 对 语音 流 进行 切 分 与 整合 加 
T, 在 这 一 组 块 单元 中 进一步 对 音节 、 词 汇 进行 
切 分 , 或 连接 不 同 组 块 单元 形成 更 高 层级 句子 、 

段落 结构 的 感知 。CPS 、delta 频段 神经 振荡 活动 
与 短语 层级 以 上 的 韵律 边界 加 工 之 间 的 密切 关系 ， 
有 可 能 反映 了 大 脑 的 这 种 组 块 偏好 (Meyer et al., 
2017)。 对 于 三 者 的 关系 ,可 以 在 未 来 研究 中 通过 
操纵 语言 材料 本 身 的 组 块 规律 (采用 不 同 节奏 特 
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点 的 语言 ) .或 基于 内 隐 学 习 可 获得 的 组 块 规律 ( 诱 
导 大 脑 以 某 种 规律 切 分 语言 ) 及 其 与 大 脑 CPS 反 
DL. delta 频段 振荡 活动 的 关系 来 进一步 验证 。 此 
外 ,这 种 组 块 偏好 是 否 在 语言 理解 过 程 中 普遍 存 
在 、 对 语言 理解 的 重要 性 是 如 何 的 ,这些 问题 同 
样 值得 研究 。 


5 韵律 边界 加 工 能 力 的 发 展 


练 水 平 影响 儿童 韵律 边界 感知 能 力 的 发 展 ， 但 需 
要 注意 的 是 ， 儿 童 发 展 语言 的 同期 也 存在 认 知 水 
平 的 发 展 。 那 么 , 认 知 发 展 在 韵律 边界 感知 能 
的 发 展 中 是 否 也 扮演 一 定 的 角色 有 待 进一步 研究 。 
另 一 方面 ，Steinhauer 等 人 (2010) 发 现 虽然 韵 
律 边界 线索 对 老年 人 的 句法 分 析 也 具有 引导 作用 ， 
帮助 他 们 解决 句法 歧义 , 但 对 比 青年 ， 老 年 人 的 
加 工 方式 与 青年 基本 一 致 ， 对 句法 和 韵律 边界 的 


韵律 边界 对 言语 理解 至 关 重 要 ,前 律 边界 是 


冲突 却 不 如 青年 敏感 。 该 研究 结果 似乎 表明 , 与 


言语 理解 中 比 句法 结构 解析 更 早 利 用 的 语言 线 
索 。 然 而 ,对 韵律 边界 的 感知 却 不 是 先天 获得 的 ， 
而 是 后 天 习 得 的 结果 且 随 年 龄 增长 消退 ， 同 时 还 
受 其 它 因素 影响 。 
5.1 和 母语 者 韵律 边界 加 工 能 力 的 发 展 

出 生 不 和 久 的 婴儿 已 经 可 通过 韵律 边界 提取 和 名 
法 信息 。 虽 然 婴 儿 脑 中 对 韵律 边界 的 加 工 尚 处 于 
较 低 水 平 ， 但 是 婴儿 仍然 能 够 通过 感知 韵律 边界 
分 割 语音 流 (Hawthorn & Gerken, 2014)。 然 而 ， 不 
同年 龄 段 的 孩子 ， 对 声学 线索 的 利用 不 同 。4 个 月 
大 的 英语 婴儿 , 在 听 辨 从句 边界 的 时 候 ， 须 依靠 
全 部 的 三 个 声学 线索 (Seidl & Cristia, 2008), 而 6 
个 月 大 的 英语 婴儿 则 主要 依赖 音 高 (Seidl，2007)， 
在 另 一 个 以 3 岁 和 6 岁 儿 童 为 研究 对 象 的 研究 中 ， 
研究 者 发 现 3 岁 儿 童 对 停顿 线索 的 依赖 优先 于 音 
长 线索 ,而 必需 要 到 6 岁 才 可 以 不 依靠 停顿 ， 仅 
仅 借助 音 长 和 音 高 来 判断 韵律 边界 (Holzgrefe-Lang 
et al., 2016; Mannel et al., 2013)。 也 就 是 说 ， 对 于 
6 岁 以 上 的 孩子 来 说 ， 音 高 和 音 长 的 组 合 就 可 以 
实现 韵律 边界 的 感知 ， 引 发 CPS. 显然 ， 随 着 年 龄 
的 增长 ， 儿童 对 边界 声学 线索 的 倚重 产生 了 变 
化 。van Ommena 等 人 (2020) 从 对 比 德语 母语 儿童 
和 法 语 母 语 儿 童 (6 个 月 和 8 个 月 ) 在 听 状 法语 并 列 
名 单 的 表现 中 发 现 ， 由 于 德语 的 韵律 边界 比 法 语 
边界 更 倚赖 界 前 延长 和 音 高 , 8 个 月 的 德语 母语 儿 
童 比 6 个 月 的 儿童 发 展 出 了 对 界 前 延长 和 音 高 的 
敏感 性 ， 而 法 语 儿 童 则 没有 出 现 这 种 现象 。 该 结 
果 显 示 声 学 线索 权重 的 发 展 变化 是 受 母语 影响 的 。 

以 上 现象 被 称 为 发 展 性 权重 转移 。 这 种 现象 
在 语音 习 得 和 韵律 习 得 中 都 有 发 生 (Seidl, 2007)。 
Seidl 和 Crestia (2008) 发 现 ， 儿 童 必须 经 历 一 个 发 
展 性 权重 转移 的 过 程 才能 获得 和 成 人 一 样 的 韵律 
边界 声学 线索 利用 策略 ， 且 转移 的 路 径 是 从 整体 
(holistic) 到 分 析 (analytic)。 已 有 研究 提示 语言 的 熟 


婴 幼 儿 的 韵律 边界 感知 能 力 随 其 年 龄 迅速 发 展 相 
反 的 是 ， 老 年 人 利用 韵律 边界 线索 的 能 力 随 年 龄 
的 增长 而 下 降 。 

综 上 所 述 , 韵律 边界 的 感知 随 着 年 龄 的 增长 
而 发 展 , 但 是 到 达 一 定年 龄 后 ， 它 有 可 能 随 着 年 
龄 的 增长 而 退化 。 这 似乎 暗示 韵律 边界 的 感知 能 
力 和 认 知 能 力 的 发 展 有 相关 关系 。 
5.2 ”二 语 者 韵律 边界 加 工 能 力 的 发 展 

韵律 边界 提供 关于 句子 结构 和 句子 意思 的 关 
键 信息 ， 是 母语 者 在 言语 加 工 中 所 依赖 的 重要 前 
律 线索 (Nickels et al., 2013)。 二 语 学 习 者 是 否 像 母 
语 者 一 样 加 工 目标 语言 的 韵律 边界 呢 ? 对 此 ,学 
界 有 不 同 的 观点 。 

Nickels 等 人 (2013) 以 英语 母语 者 和 德 - 英 (L2) 
学 习 者 为 被 试 ， 以 停顿 为 韵律 边界 (语调 边界 ) 的 
操控 手段 ， 以 自然 度 判 断 为 实验 任务 考察 不 同 语 
言 背 景 的 听话 人 对 韵律 边界 的 敏感 性 。 如 (1)When 


a bear is approaching the people#1 the dogs come 


running. (2) When a bear is approaching # 2 the 
people#3 come running. 这 样 的 口语 句子 , 4 SALE 
分 别 为 名 中 a. 无 任何 语调 韵律 边界 ; b.#1 处 有 边 
界 ;c.#2 处 有 边界 ; d. #2 和 #3 处 都 有 边界 。 结 果 发 
现 二 语 学 习 者 在 判断 自然 度 的 得 分 上 与 母语 者 没 
有 显著 差异 ， 脑 电 成 分 仅 在 时 间 上 比 母 语 者 稍 有 
延迟 ,但 总 体 模 式 是 一 样 的 。 在 其 进一步 的 研究 
(2018) 中 ,被 试 群体 扩展 为 母语 者 和 不 同 语言 距 
离 的 两 个 学 习 者 群体 ,， 德 - 英 (L2) 学 习 者 和 汉 - 英 
(L2) 学 习 者 ， 其 他 实验 组 成 不 变 。 结果 发 现 , 汉语 
学 习 者 也 反应 出 与 母语 者 和 德语 学 习 者 趋势 一 至 
的 行为 和 脑 电 结果 , 但 是 条 件 d 情况 下 的 接受 度 
显著 高 于 德语 和 英语 者 ， 反 映 错误 边界 ( 即 冯 处 ) 
的 脑 电 幅度 并 没有 像 德 语 学 习 者 一 样 随 目标 语言 
熟练 度 增 大 而 增 大 ， 似 乎 更 倾向 于 自 下 至 上 的 加 
工 方式 ， 而 不 是 另 两 个 组 别 所 显示 的 自 上 而 下 的 
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预测 性 的 加 工 方式 。 对 于 汉语 学 习 者 的 表现 ， 作 
者 解释 为 也 许 和 所 采用 的 动词 有 关 ， 也许 和 边界 
前 韵律 廊 形 的 知觉 有 关 。 以 上 两 个 实验 似乎 暗示 ， 
韵律 边界 的 应 用 可 能 涉及 到 的 不 仅仅 是 边界 声学 
线索 的 知觉 ， 而 且 还 涉及 到 多 个 维度 甚至 是 多 个 
模 态 线索 的 整合 ,， 并且 该 过 程 受 母 语 经 验 的 影 
响 。 未 来 的 研究 应 该 以 全 局 观 来 看 待 韵 律 边界 的 
感知 问题 。 

但 也 有 研究 者 持 有 不 同 的 观点 ， 他 们 认为 二 
语 者 不 能 像 母语 者 一 样 运用 韵律 边界 .Pennington 
All Ellis (2000) 选 择 粤 - 英 (L2) 双 语 被 试 ， 所 采用 的 
任务 是 辨别 当下 听 到 的 英语 句子 是 否 与 先前 听 过 
的 句子 一 致 。 听 辨 任务 分 成 两 个 阶段 。 第 一 个 阶 
Be, 被 试听 24 个 目标 句子 。 第 二 阶段 , 再 听 48 
个 测试 句 ， 并 判断 测试 名 中 有 哪些 是 第 一 阶段 出 
现 过 的 。 测 试 句 分 成 三 类 , 第 一 类 是 词语 不 同 但 
句法 相同 的 句子 , 第 二 类 是 从 目标 句 中 挑选 出 来 
的 句子 , 第 三 类 是 词语 相同 但 是 韵律 线索 不 同 的 
句子 。 结 果 发 现 ,被 试 在 判断 第 一 类 和 第 二 类 名 
子 的 表现 远 好 于 随机 水 平 , 但 是 第 三 类 句子 却 远 
低 于 随机 水 平 。 即 便 是 被 提醒 注意 韵律 方面 的 差 
异 (第 二 个 实验 ), 结果 没有 改善 。 对 此 ,作者 解释 
为 ,在 课室 学 习 的 外 语 者 , 尤其 是 处 在 具有 背诵 
文化 的 教育 环境 下 ， 是 习惯 于 将 韵律 特征 和 句子 
意义 捆绑 在 一 起 学 习 的 ,没有 专门 对 语音 线索 的 


界 的 认识 带 来 了 新 的 方向 。 以 上 的 4 个 研究 给 二 
语 韵律 边界 感知 发 展 领域 留 下 了 多 个 值得 进一步 
探索 的 问题 。 

训练 可 以 促进 韵律 边界 的 感知 能 力 。Yang 
(2016) 在 课堂 教学 中 发 现 通过 跟 读 (shadowing) 目 
标语 言 的 表达 方式 或 模仿 的 方式 再 现 自然 声音 模 
式 ， 可 以 帮助 学 习 者 在 头脑 中 再 现 说话 者 韵律 边 
界 和 句法 理解 的 联系 。 目 前 已 有 的 结果 并 没有 揭 
示 训 练 影响 韵律 边界 感知 的 机 制 , 我 们 不 清楚 是 
什么 因素 影响 了 边界 感知 ， 也 不 清楚 边界 感知 中 
哪个 具体 的 线索 被 影响 。 鉴 于 外 语 学 习 者 普遍 反 
映 的 听力 困难 、 母 语 者 说 得 太 快 等 现象 ， 也 可 能 
是 由 于 韵律 边界 感知 缺失 造成 的 ， 韵律 边界 的 感 
知 习 得 机 制 和 训练 值得 更 深入 的 研究 。 


6 韵律 边界 加 工 的 未 来 展望 


韵律 边界 是 韵律 中 的 一 个 物理 表征 ,与 重音 
和 语调 相 比 , 具有 更 多 的 认 知 功能 ， 是 我 们 观察 
口头 语言 加 工 和 习 得 的 重要 窗口 ， 因 而 被 众多 研 
究 作 为 观察 对 象 和 操控 对 象 。 通 过 对 心理 学 和 语 
言 学 领域 的 韵律 边界 研究 进行 全 面 的 总 结 和 分 析 ， 
可 以 发 现 ,关于 韵律 边界 的 研究 还 有 很 多 问题 需 
要 进一步 的 探讨 。 
6.1 韵律 边界 的 声学 表现 需要 进一步 探讨 

韵律 边界 语音 声学 信号 加 工 的 研究 结果 非常 


感知 进行 培训 。 除 此 之 外 , 还 有 可 能 是 学 习 者 并 
不 懂得 韵律 线索 (包括 边界 ) 和 句法 / 句 意 之 间 的 投 
射 关 系 。 学 习 者 的 失败 究竟 是 因为 未 能 感知 到 边 
界 声学 线索 还 是 不 能 进行 正确 的 投射 ， 又 或 是 由 
于 任务 对 学 习 者 的 认 知 资源 消耗 太 多 ， 使 得 学 习 
者 无 暇 分 心 关 注 韵律 线索 ?然而 ,作者 并 没有 进 
一 步 探查 。Schmidt 等 人 (2019) 的 观点 来 源 于 记忆 
实验 。 他 们 以 英语 母语 者 和 希 - 英 (L2) 学 习 者 为 被 
试 ， 以 数字 记忆 (测量 的 方式 类 似 于 数字 广度 记忆 
测量 法 ) 为 任务 ， 比 较 有 韵律 边界 和 无 韵律 边界 的 
条 件 下 , 母语 者 和 外 语 学 习 者 对 数字 的 记忆 成 
绩 。 结 果 发 现 , 在 有 韵律 边界 的 情况 下 ， 两 个 群体 
对 母语 数字 的 记忆 成 绩 都 好 于 没有 韵律 边界 下 的 
记忆 ,但 外 语 数字 的 记忆 成 绩 则 不 受 韵 律 边界 存 
留 的 影响 。 对 于 该 现象 ,作者 认为 韵律 边界 是 深 
层 结构 ， 因 而 外 语 者 不 能 像 母 语 者 一 样 应 用 。 该 
研究 的 结论 与 传统 观点 不 一 致 。 传 统 上 ,韵律 边 
界 是 语言 的 表层 结构 。 无 疑 ， 这 个 观点 为 韵律 边 


丰富 , 研究 者 们 基于 母语 者 的 加 工 ， 对 韵律 边界 
的 结构 等 级 、 强 度 的 声学 线索 表征 、 韵 律 边界 的 
感知 权重 分 配 (包括 单线 索 和 线索 组 合 ) 等 方面 做 
了 深入 的 探查 。 这 些 研究 结果 为 听力 障碍 辅助 器 
材 的 设计 (如 人 入 工 耳蜗 )、 语 音 识别 和 人 工 语言 的 合 
成 提供 了 坚实 的 实证 基础 。 然 而 , 已 有 人 研究 未 能 
将 句法 的 影响 一 同 考 查 ,， 考虑 到 韵律 边界 和 语言 
加 工 的 紧密 关系 ， 这 方面 的 研究 还 需要 进一步 加 
强 。 另 外 , 这 类 研究 绝 大 部 分 在 实验 室 开 展 的 ， 其 
使 用 的 实验 材料 以 朗读 素材 (reading speach) 为 主 ， 
因而 削弱 了 生态 效 度 。 未 来 的 研究 可 以 扩大 研究 
面 ， 以 不 同文 体 风 格 的 口头 语言 为 素材 ， 比 如 讲 
故事 、 朋 友 间 的 随 性 聊天 等 ， 在 不 同 的 背景 环境 
下 (比如 有 /无 噪音 ) 考 查 听 者 对 韵律 边界 声学 线索 
特征 的 运用 情况 。 最 后 ,未 来 对 待 声学 线索 感知 
特征 的 描述 可 以 进一步 细 化 ,不 要 仅仅 考查 单个 
线索 的 存留 对 边界 感知 的 影响 ,而 是 以 连续 性 的 
视角 (例如 ， 阅 值 ) 来 看 待 声学 线索 对 感知 的 影响 。 
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6.2 ”韵律 边界 的 加 工 过 程 需 要 进一步 明确 

以 往 研究 者 主要 通过 CPS 和 大 脑 低频 段 的 
“夹带 ”作用 ( 即 神经 振荡 活动 ) 曾 述 了 韵律 边界 的 
加 工 机 制 , 证 实 了 韵律 边界 能 够 独立 于 其 他 语言 
信息 被 独立 加 工 、 并 且 和 语言 结构 的 感知 、 语 义 
或 句法 的 理解 密切 相关 。 但 是 ， 对 于 韵律 边界 的 
认 知 神经 机 制 , 仍然 存在 许多 未 解决 的 问题 。 首 
先 ， 关 于 韵律 边界 的 认 知 神经 机 制 的 时 空 特点 仍 
有 许多 问题 需要 进一步 考察 。 例 如 ， 以 往 研 究 初 
步 发 现 ,“ 夹 带 ” 作 用 能 够 分 别 反 映 上 听觉 脑 区 对 前 
律 边界 的 自 下 而 上 加 工 过 程 、 或 高 级 额 叶 脑 区 基 
于 对 韵律 边界 的 预期 对 显 - 顶 区 域 的 自 上 而 下 调 
控 过 程 ,但 对 这 两 种 过 程 产生 交互 作用 时 各 自发 
挥 作用 的 具体 时 间 进 程 和 脑 网 络 特点 缺乏 系统 的 
讨论 。 此 外 , 不同 于 其 他 语言 线索 ， 声 学 韵律 边界 
非 与 语义 边界 、 句 法 边界 存在 一 一 对 应 关系 ， 


研究 较 少 直接 讨论 这 一 点 。 探 究 这 一 问题 将 有 助 
于 理解 韵律 边界 加 工 和 其 他 高 级 语言 认 知 功能 的 
潜在 关系 、 以 及 为 一 些 语言 能 力 发 展 不 足 (例如 阅 
读 障碍 儿童 ) 或 退化 的 人 群 (例如 老年 人 、 存 在 语言 
障碍 的 患者 ) 提 供 可 能 的 干预 方案 。 
6.3 ”韵律 边界 加 工 与 句法 加 工 的 关系 需要 进 一 

步 厘 清 

已 有 研究 发 现 韵 律 边界 影响 句子 加 工 , 句法 
可 以 预测 韵律 边界 ,而且 二 者 相互 制约 。 这 些 观 
点 得 到 了 行为 实验 和 神经 科学 证 据 的 支持 。 但 是 ， 
这 些 研 究 结 果 是 基于 语义 、 句 法 和 韵律 是 分 层 的 
假设 (Ischebeck et al.，2008)， 其 研究 框架 主要 是 
韵律 信息 (和 其 它 非 句法 信息 ， 如 词汇 、 语 用 等 ) 
和 句法 信息 在 句子 加 工 中 的 地 位 和 关系 。 即 ， 听 
一 句 话 的 时 候 是 首先 使 用 句法 信息 对 句子 进行 分 
解 还 是 同时 运用 多 个 信息 对 句子 进行 解析 。 其 中 ， 


尚 不 清楚 当 预 期 韵律 和 底层 输入 的 声学 韵律 产生 
冲突 时 ， 哪 一 过 程 会 以 更 高 的 相对 权重 影响 韵律 
边界 感知 。 再 者 ， 近 来 研究 提示 , CPS, delta 频段 
的 “夹带 ”作用 和 大 脑 偏 好 以 短语 为 单位 对 语言 进 
行 组 块 , 三 者 的 关系 需要 进一步 验证 , 在 二 语 者 、 
特殊 人 和 群 中 拓展 研究 也 将 有 利于 理解 大 脑 对 韵律 
边界 的 加 工 特 点 和 语言 特点 、 发 展 的 关系 。 第 二 ， 
尚 不 清楚 对 韵律 边界 的 “夹带 ”作用 的 认 知 重要 性 
是 如 何 的 。 在 安静 环境 中 进行 口语 理解 时 ， 韵律 
被 认为 是 一 种 辅助 而 非 必 要 的 线索 ， 即 使 在 去 除 
韵律 音 高 波动 信息 (Xu etal., 2013) .或 去 除 停顿 线 
索 (e.g. Li & Yang, 2009; Kayser et al., 2015) 时 ， 听 
者 仍然 能 够 正常 理解 口语 句子 ， 而 在 噪声 场景 中 
对 韵律 结构 的 感知 能 力 和 口语 感知 成 绩 存在 相关 
(Slater & Kraus, 2016)。 对 韵律 边界 的 自 上 而 下 时 
间 预 期 是 一 种 韵律 边界 加 工 过 程 中 普遍 应 用 的 机 
制 ( 即 不 依赖 于 场景 条 件 而 存在 )， 还 是 只 在 困难 
条 件 下 (如 噪声 掩蔽 .语音 音质 受 损 等 ) 才 会 发 挥 作 
用 ? 这 些 问题 有 待 未 来 研究 讨论 。 最 后 ,许多 研 
究 证 据 表明 韵律 边界 加 工会 影响 高 级 语言 加 工 
(例如 语义 、 句 法 加 工 )， 在 个 体 水 平 上 ， 对 语言 前 
律 时间 结 构 的 加 工 能 力 和 其 进行 语音 感知 、 阅 读 
理解 的 能 力 有 关 (e.g. Cason et al., 2015; Cumming 
et al., 2015; Flaugnacco et al., 2015; Hidalgo et al., 
2017; Schön & Tillmann, 2015; Slater & Kraus, 
2016)， 这 说 明 不 同 个 体 基 于 韵律 边界 加 工 促进 高 
级 语言 功能 的 具体 机 制 可 能 存在 差异 , 但 目前 的 


韵律 边界 线索 处 于 辅助 地 位 。 然 而 , 已 有 的 结果 
显示 韵律 边界 和 句法 的 关系 并 不 是 一 对 一 的 简单 
关系 ， 而 是 要 比 我 们 知道 的 复杂 得 多 。 章 律 边界 
可 能 不 仅仅 是 一 个 通过 和 和 句法 相互 作用 而 参与 名 
子 理解 的 表层 结构 ， 其 在 本 质 上 可 能 就 是 语言 规 
则 的 具 身 表现 (embodiment)， 是 将 抽象 的 规则 、 物 
理 世 界 和 人 类 体验 联结 在 一 起 的 接口 (Giraud & 
Poeppel, 2012; Kreiner & Eviatar, 2014)。 韵律 边界 
的 大 小 (边界 的 大 小 以 声学 特征 来 表征 ) 表 现 了 名 
子 成 分 之 间 关 系 的 紧密 程度 ， 再 现 言 语 的 层级 组 
织 结构 ， 以 体现 语言 信息 在 时 域 上 布局 的 方式 ， 
方便 大 脑 通过 振荡 模拟 其 节奏 ， 从 而 捕捉 到 抽象 
的 语言 组 织 规则 。 比 如 ,韵律 边界 长 度 的 研究 发 
现 韵 律 边 界 特异 性 脑 电 成 分 CPS 并 不 能 仅仅 被 声 
学 线索 诱发 ， 而 是 对 一 定 长 度 组 块 (如 : 短语 ) 对 语 
音 流 进行 切 分 与 整合 加 工 的 反应 。 又 如 Ding 等 人 
(2015) 的 蜂 语 言 研 究 发 现在 次 语调 韵律 边界 所 产 
生 的 EEG 成 分 的 强度 显著 地 大 于 韵律 单位 内 部 
位 置 上 产生 的 强度 ( 见 前 文 )。 未 来 的 研究 可 以 跳出 
传统 的 结构 语言 学 框架 ,而 从 具 身 研究 的 角度 ， 
利用 EEG 和 MEG 技术 , 使 用 不 同 节奏 规律 的 语 
言 、 滤 波 和 语音 反 转 等 手段 操纵 韵律 边界 的 感知 ， 
检视 韵律 边界 感知 的 神经 振荡 特征 和 句法 解析 之 
间 的 关联 性 ， 从 而 深入 揭示 韵律 边界 的 实质 和 功 
能 ,进一步 厘清 韵律 边界 加 工 与 句法 加 工 的 关系 。 
6.4 ”韵律 边界 加 工 能 力 的 发 展 需要 进一步 关注 
韵律 边界 的 声学 线索 加 工 能 力 与 语言 理解 息 
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BHX, 但 我 们 对 三 语 者 的 韵律 边界 加 工 能 力 发 
展 情况 所 知 不 多 。 遗 憾 的 是 ， 以 二 语 者 加 工 韵律 
边界 为 主题 的 文献 极 少 。 我 们 不 清楚 二 语 者 与 母 
语 者 韵律 边界 的 加 工 差异 到 底 存 在 于 哪些 具体 的 
方面 ， 比 如 是 对 具体 某 个 声学 线索 的 知觉 差异 
吗 ? 也 不 清楚 导致 这 些 差异 的 因素 。 是 二 语 者 采 
用 不 同 于 目标 语 的 线索 感知 权重 模式 引起 的 不 
同 ? 还 是 二 语 者 所 采用 的 加 工 机 制 不 同 ， 比 如 采 
用 不 同 于 母语 者 的 加 工 方向 而 引起 不 同 ? 虽然 已 
有 研究 提出 背景 语言 差距 大 的 二 语 者 可 能 更 倾向 
于 使 用 自 下 而 上 的 线索 (Nickels & Steinhauer, 
2018)， 但 并 没有 研究 专门 回答 该 问题 。 除 此 之 外 ， 
也 有 人 提出 了 CPS 实际 上 是 整合 结果 的 体现 (Nickels 
et al.，2013)， 那 么 ,二 语 者 是 否 也 具备 和 母语 者 
一 样 的 整合 能 力 呢 ? 从 神经 学 层面 来 看 ， 二 语 者 
和 母语 者 加 工 韵 律 边界 的 时 间 进 程 和 脑 网 络 是 和 否 
存在 不 同 的 特点 ? 这 些 问题 都 值得 进一步 探究 。 
听力 理解 困难 一 直 是 二 语 教学 的 重大 问题 。 
外 语 学 习 者 常常 抱怨 母语 者 说 话 太 快 ， 其 背后 原 
因 可 能 是 二 语 者 不 能 有 效 地 利用 韵律 边界 将 语 流 
进行 切 分 。 如 果 能 对 韵律 边界 的 感知 能 力 进行 培 
训 的 话 ,， 那么 二 语 听力 困难 将 有 一 个 全 新 的 解决 
方案 。 然 而 ， 目 前 针对 二 语 者 韵律 边界 加 工 能 
发 展 过 程 的 研究 也 几乎 为 零 。 二 语 者 的 边界 感知 
能 力 是 如 同 母 语 者 一 样 从 整体 到 局 部 地 发 展 ， 还 
是 受 母 语 迁移 的 影响 而 产生 石化 (fossilizaiton) 现 
象 ? 又 或 者 是 逐步 发 展 出 符合 目标 语 加 工 的 次 级 
技能 (subskills)， 最 终 接 近 目 标语 母语 者 的 水 平 ? 
如 果 是 这 样 ,那么 韵律 中 介 语 的 发 展 路 径 又 是 如 
何 ， 是 否 受 母语 经 验 的 影响 而 具有 特异 性 的 发 展 
途径 呢 ? 教学 干预 是 否 能 够 提升 韵律 边界 加 工 能 
力 ? 例如 利用 边界 声学 线索 感知 训练 增强 自 下 而 
上 的 加 工 能 力 或 者 利用 节奏 训练 增加 其 自 上 而 下 
的 加 工 能 力 ? 要 回答 上 述 问 题 , 未 来 的 研究 必须 
关注 学 习 者 二 语 韵 律 边界 声学 线索 的 在 线 加 工 机 
制 、 习 得 过 程 和 不 同 训练 方法 的 效益 问题 。 除 此 
之 外 ,还 应 该 关注 个 体 在 声学 线索 感知 上 的 差异 
可 能 带 来 的 影响 ， 以便 在 教材 编写 和 教学 设计 上 
能 够 更 有 针对 性 。 
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Abstract: The perception of prosodic boundaries is critical to spoken language comprehension, and it has 
become a primary research topic among psychologists and psycholinguists in the past decade. Utterances are 
chunked into prosodic units of different strengths. The boundaries between prosodic units are mainly 
signaled by acoustic cues like pitch change, final lengthening, and pause. Previous cognitive, linguistic, 
developmental, and neuroimaging studies have significantly advanced our understanding of the processing 
of prosodic boundaries. We now know that listeners use a perceptual weighting strategy to process prosodic 
boundary cues, and there are specific brain mechanisms for prosodic boundary processing. The ability to 
processing prosodic boundaries steadily develops with age in young children and transfers to a second 
language, but it generally decreases with age in older adults. Future studies should expand the investigation 
of prosodic boundaries to more pragmatic genres and focus on revealing the cognitive mechanisms 
underlying prosodic boundary processing, the relationship between prosodic boundary and syntax 
processing, and the development of prosodic boundary perception in second language learners. 
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